TKDE2022 | 最新深度学习推荐系统综述:从协同过滤到信息增强的推荐系统
深度学习技术已经在计算机视觉以及自然语言理解等领域取得了巨大的成功,受其影响深度学习研究也开始在推荐系统领域得到关注。近些年来,已经见证了基于神经网络的推荐系统的巨大进步,其已经超越了传统推荐模型的性能。不同于之前文献[1][2]基于深度模型的结构进行综述(比如以MLP、CNN、RNN等进行分类),也不同于之前文献对于某一子领域进行综述[3][4](比如跨域推荐、知识图谱推荐等),本文以推荐模型的准确性为目标,从推荐模型的角度对神经推荐模型进行了系统的综述,旨在总结该领域的研究成果,为研究推荐系统的研究者和实践者提供参考。具体来说,根据推荐模型建模所利用的数据进行分类,把当前的工作分为了基于协同过滤的方法和基于信息增强的方法。另外,把基于信息增强的方法又进一步分为了内容增强的方法和基于时序/序列的推荐方法,下文将对上述方法进行详细介绍。
论文:https://arxiv.org/pdf/2104.13030
论文合集:github.com/hongleizhang/RSPapers
2.2 建模文本特征的一类方法主要是利用自然语言处理技术对特征进行处理,比如基于自编码器的方法、基于词嵌入的方法、基于注意力机制的方法以及基于文本可解释性的推荐方法等。
2.3 建模多媒体特征的一类方法主要是根据输入的数据是图片数据还是视频数据还是音频数据以及它们的结合进行了分类,下图总结了建模的要点以及代表模型,感兴趣的读者可以阅读原文。
2.4 建模社交网络特征的一类方法主要是分为了社交正则化的方法和GNN的方法,更多基本内容与详细分类可阅读社会化推荐浅谈。
2.5 建模知识图谱特征的一类方法主要是分为了基于路径的方法、基于正则化的方法和GNN的方法,更多基本内容与详细分类可阅读基于知识图谱的推荐系统总结。
三、基于时序/序列的方法是指在利用用户对物品的交互矩阵的基础上添加上下文信息并进行建模的方法。其中,在上述方法的基础上考虑了交互矩阵的时效性,即用户的偏好是动态变化的。因此基于时序/序列的方法旨在建模用户动态偏好以及随时间变化的序列模式。基于此,主要分为基于时序的推荐方法、基于会话的推荐方法以及基于时序/会话混合的推荐方法。
3.2 基于会话的方法主要是建模序列间物品与物品间的交互模式,因此其一般是不会存在用户登录相关的信息,其代表性的模型为SASRec等。
3.3 基于时序/会话混合的方法主要是对用户的动态特征以及物品的序列模式进行建模,其代表性的模型为S3-rec等。
以上所介绍的基于神经网络的推荐模型都证明了其推荐性能的优越性。然而,该领域还有许多需要改进的地方。因此,作者从基础标准库的构建、图推理以及自监督建模和多目标优化评估的角度提出了一些值得进一步研究的方向。最后也讨论了对于推荐模型的可重现性的看法。
参考文献:
Zhang et al. Deep learning based recommender system: A survey and new perspectives. ACM Comput.Surv, 2018.
Batmaz et al. A review on deep learning for recommender systems: challenges and remedies. Artificial Intelligence Review, 2018. M. M. et al, Cross-domain recommender systems: A systematic literature review, ACM CSUR, 2017. Q. Guo, et al, A survey on knowledge graph-based recommender systems, IEEE TKDE, 2020.
欢迎干货投稿 \ 论文宣传 \ 合作交流
推荐阅读
由于公众号试行乱序推送,您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容, 请将本号设为星标,以及常点文末右下角的“在看”。
由于公众号试行乱序推送,您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容, 请将本号设为星标,以及常点文末右下角的“在看”。